决策树集合中汇总分类估计的一种常见方法是使用投票或平均每个类别的概率。后者考虑了不确定性估计值的可靠性(可以说,“不确定性的不确定性”)。更普遍的是,如何最好地结合来自多个来源的概率估计值,这是未知的。在本文中,我们研究了许多替代预测方法。我们的方法受到概率,信念功能和可靠分类的理论的启发,以及我们称证据积累的原则。我们对各种数据集的实验是基于随机决策树,该决策树保证了要组合的预测中的高度多样性。出乎意料的是,我们发现将平均值超过概率实际上很难击败。但是,证据积累在除小叶子以外的所有叶子上都表现出更好的结果。
translated by 谷歌翻译
分类链是一种用于在多标签分类中建模标签依赖性的有效技术。但是,该方法需要标签的固定静态顺序。虽然理论上,任何顺序都足够了,实际上,该订单对最终预测的质量具有大量影响。动态分类链表示每个实例对分类的想法,可以动态选择预测标签的顺序。这种方法的天真实现的复杂性是禁止的,因为它需要训练一系列分类器,以满足标签的每种可能置换。为了有效地解决这个问题,我们提出了一种基于随机决策树的新方法,该方法可以动态地选择每个预测的标签排序。我们凭经验展示了下一个标签的动态选择,通过在否则不变的随机决策树模型下使用静态排序。 %和实验环境。此外,我们还展示了基于极端梯度提升树的替代方法,其允许更具目标的动态分级链训练。我们的结果表明,该变体优于随机决策树和其他基于树的多标签分类方法。更重要的是,动态选择策略允许大大加速培训和预测。
translated by 谷歌翻译